Une différente approche

de la relativité restreinte.

Peut-être connaissez-vous bien la théorie de la relativité restreinte ou bien vous n'en avez qu'une vision vulgarisée. Toujours est-il que vous l'avez certainement découverte par le biais de ses aspects physiques, constance de la vitesse de la lumière, contraction des longueurs, dilatation des durées, etc., à la consonance quelque peu magique et tout au moins loin de l'expérience quotidienne.

Je me propose ici de vous faire appréhender la relativité d'une façon différente, qui vous le verrez parle parfois mieux au sens commun. Celle-ci ne fait appel qu'à des concepts mathématiques, mais que cela ne vous rebute pas, ils ne sont pas très compliqués. Je ne rappelerai pas la description classique de la relativité; si vous souhaitez vous en rememorer les aspects principaux, il y a de nombreux sites pour cela, tel qu'ici ou le luxorion.

Afin de faire ressortir les aspects parlants, j'ai découpé cet exposé en deux parties; la première va vous mettre à contribution , et la seconde donne la réponse. Donc ne regardez pas tout de suite la seconde partie, svp. En conclusion je discuterai des avantages de cette description de la relativité restreinte vis-à-vis de la description physique. Comme la seconde partie peut rebuter certains lecteurs, je les invite à lire la conclusion plutôt que de quitter cette page. En effet, il serait dommage de ne pas comprendre les conséquences de cette description.

Quelques exercices ...

Rassurez-vous, ils sont simples et le but est de vous faire trouver par vous-même cet autre point de vue. Vous n'avez besoin que de connaissances de lycée en géométrie et d'un peu de calcul.

Faisons d'abord un rappel, si M et N sont deux quadri-vecteurs position de coordonnées (x_M, y_M, z_M, c.t_M) et (x_N, y_N, z_N, c.t_N), leur produit scalaire est :

M.N = x_M.x_N + y_M.y_N + z_M.z_N - c².t_M.t_N

D'autre part, la transformation de Lorentz s'écrit :

x' = g(x - vt)

y' = y

z' = z

t' = g(t - vx/c²)

avec

g = (1 - b²)^-1/2

b = v/c

Sachant cela, pouvez-vous dire ce que devient le produit scalaire, après avoir appliqué la transformation de Lorentz à M et N ? Comme y et z ne jouent ici aucun rôle ils peuvent être éliminés du calcul pour simplifier.
Que pouvez-vous en déduire de la dépendance vis à vis de cette transformation de,

la distance
une autre grandeur tirée du produit scalaire et de la distance (je vous laisse trouver laquelle).

Enfin, quelles sont les transformations que vous connaissez qui ont les propriétés que l'on vient de montrer ? Parmi ces deux-là, laquelle ne peux pas être la transformation de Lorentz ? Conclusion.

La soluce ...

Si vous avez déjà lu des livres de vulgarisation de la relativité comme celui d'Einstein lui-même (cf. annexe 2), vous savez peut-être déjà de quoi il s'agit.

Cette transformation conserve la distance et le produit scalaire, donc les angles. La translation et la rotation sont deux transformations ayant ces propriétés, mais la translation déplace l'origine du repère, ce qui n'est pas le cas ici.

Donc, la transformation de Lorentz est une rotation.

La suite fait appel à des notions de calcul matriciel. Pour savoir l'essentiel dans ce domaine, voir en fin de page.
Pourtant, la matrice de transformation g ne ressemble pas à une matrice de rotation avec ses termes tendant vers l'infini et sa symétrie. En ne gardant dans la suite que les deux dimensions utiles, x et c.t, elle se note :

g = | g  -gb|
    |-gb  g |

Une matrice de rotation L doit répondre aux deux propriétés :

det L = 1
^tL = L^-1 soit L.^tL = ^tL.L = I

g répond à la première propriété, g²-g²b² = 1, mais pas à la seconde. C'est normal car cette propriété s'exprime en fait plus généralement et met ici en jeu la matrice h (note 2)

|1  0|
|0 -1|

Il existe une autre démonstration qui s'appuie sur une représentation complexe de l'espace de Minkowsky. Si L s'écrit en général

|a b|
|c d|

alors on a les cinq relations suivantes b² = c² a² = d² ad - bc = 1 (det) ac + bd = 0 ab + cd = 0

En triturant tout ça, on arrive à l'expression connue

| a b|
|-b a|

Mais rien n'interdit à a et b d'être imaginaires, tout comme Minkowsky avait rendu la coordonnée de temps imaginaire. Si je pose maintenant a = c et b = is, je remarque que,

det L = c² - s² = 1
la distance euclidienne d = x² + y² est conservée

Ça prend forme ! Le déterminant de L a la forme de celui de g (différence de carrés) et si y = it (Minkowsky) on retrouve l'expression de la distance en relativité et la même forme que la transformation de Lorentz, malgré la présence de i.

Enfin, si on retourne à l'expression classique de la transformation (matrice symétrique à coefficients réels) et qu'on combine deux transformations g₁ et g₂, on devrait aussi en trouver une troisième qui est une rotation. Or les coefficients peuvent s'écrire ainsi :

c₁.c₂ + s₁.s₂ c₁.s₂ + c₂.s₁ qui font immédiatement penser à des fonctions trigonométriques.

La solution est simple, et l'expression du déterminant de L doit y faire penser. c et s sont les fonctions hyperboliques ch et sh et l'angle de la rotation est un angle hyperbolique, ou, si on se souvient des formules

sin iu = i.sh u cos iu = ch u c'est un angle imaginaire.

| ch(u) ish(u)|    
|-ish(u) ch(u)| = L

Et en identifiant à la transformation de Lorentz g = ch u gb = sh u b = th u À noter que cette dernière expression explique pourquoi il existe une vitesse limite infranchissable; une tangente hyperbolique ne dépasse jamais 1 (remarque, on choisi c car cette vitesse vérifie cette propriété).

Bien, j'ai fait toute cette démonstration car en relativité, il n'est pas évident que l'angle soit conservé; si on écrit le produit scalaire ||M||.||N||.cos(u), il peut arriver qu'il ne soit pas nul alors qu'une distance l'est.

Ainsi, avec une seule hypothèse sur l'expression du produit scalaire (on peut montrer que cela se rapporte aux deux conditions sur L, voir note 2), en ne traitant qu'avec des valeurs réelles et en élargissant la définition d'un angle, on peut démontrer rigoureusement que la transformation de Lorentz est une rotation.

Discussion

Ce qui est intéressant, c'est de voir à posteriori comment on peut interpréter ce résultat. La relativité est évidemment issue de l'observation; les principes physiques sur lesquels elle repose ont été suggérés par l'expérience. Mais on aurait tout aussi bien pu se demander quelles transformations les plus générales possibles on pouvait faire subir aux coordonnées tout en conservant quelques propriétés (la distance par exemple). En fait, il conviendrait de les triturer de toutes les manières envisageables puis de voir ce qui colle avec la réalité. Faire apparaître des nombres imaginaires ou un produit scalaire non usuel ne vient pas toujours à l'esprit des physiciens, mais est courant chez les mathématiciens.

Et c'est en fait le cas. En posant l'expression de la distance et son invariance par changement de coordonnées, on retrouve la rotation 3D bien connue et la rotation d'angle hyperbolique (moyennant une définition plus étendue de ce qu'est une rotation). De là, on retrouve les résultats de la relativité, dont

il existe une vitesse limite (|b| = |th u| <= 1), qu'on identifie à celle de la lumière.
la vitesse de la lumière est la même dans tout référentiel (composition des vitesses : b₃= (b₁ + b₂) /(1 + b₁.b₂) )
la contraction et la dilatation des distances et des durées (ch u >= 1)

et on peut identifier cette rotation à la transfo de Lorentz en écrivant la quatrième coordonnée : c.t. Mais indépendamment de cela, la relativité peut ainsi être retrouvée uniquement sur des principes géométriques, sans faire appel à des notions physiques (bien qu'il faille la physique au moins pour confirmer l'existence de cette transfo. C'est une interprétation purement géométrique de la physique. Si vous arrivez à comprendre cela, vous devriez plus facilement comprendre que d'autres lois physiques puissent être vues sous un angle purement géométrique. C'est le cas de la gravitation en particulier.

Bon, j'espère ne pas trop vous avoir abruti de formules. Elles me semblaient nécessaires pour mieux comprendre le raisonnement et seront un support pour qui souhaitera refaire les calculs par lui-même. Et surtout, j'espère ne pas avoir été obscure.

1-Rappel de calcul matriciel

Ci-dessous, quelques notions de base sur les matrices. Comme vous le verrez, il n'y a rien de difficile, dès lors qu'on sait ce qu'est une matrice et que l'addition et la multiplication ne nous sont pas inconnues.

Une matrice est un tableau de nombres. Exemple :

    | 1  2  0 -2 -1 |

M = |-1  0  2  3 -3 |

    | 3  1 -2  0  1 |

Un coefficient, un des nombre de la matrice, est noté m_ij, où i est le numéro de la ligne et j le numéro de la colonne où se trouve se coefficient. Ainsi, m_{2 5} = -3. Un vecteur est une matrice particulière à une seule dimension. On en trouve de deux types, les vecteurs colonnes et les vecteurs lignes. Exemples :

    | 1 |

u = |-1 |

    | 0 |

et    v = | 0  1  0  0 |

Une autre matrice particulière est la matrice unité, I, carrée et où seuls les coefficients de la diagonale sont non nuls et égaux à 1.
La transposée d'une matrice M est la matrice obtenue en inversant les lignes et les colonnes de M. On la note ^tM. Ainsi la transposée de la matrice ci-dessus s'écrit :

     | 1 -1  3 |

     | 2  0  1 |

^tM = | 0  2 -2 |

     |-2  3  0 |

     |-1 -3  1 |

De plus, la transposée d'un vecteur colonne est un vecteur ligne et vice-versa. On appelle en général vecteur, une colonne et une ligne, transposée d'un vecteur.

On peut multiplier à droite la matrice A par la matrice B si elles répondent à la règle suivante :

le nombre de colonnes de A est égale au nombre de lignes de B. Ce produit matriciel se note A.B et a pour résultat une autre matrice dont les coefficients se déterminent ainsi : c_ij = S_k a_ik.b_kj le coefficient à la croisée de la ligne i et la colonne j de C est la somme des produits des coefficients de la ligne i de A avec les coefficients correspondants de la colonne j de B. Un exemple sera plus parlant. Le coefficient 2, 3 du produit M.^tM est :

                                | .  .  3 |

| . . . |   | .  .  .  .  . |   | .  .  1 |

| . . c | = |-1  0  2  3 -3 | * | .  . -2 |

| . . . |   | .  .  .  .  . |   | .  .  0 |

                                | .  .  1 |

c = -1*3 + 0*1 + 2*(-2) + 3*0 + (-3)*1 Pour vérifier que vous avez compris, le résultat de cet exemple est :

       |10  -4   4 |

M.^tM = |-4  23 -10 |

       | 4 -10  15 |

Pour finir, le cas particulier du produit de la transposée d'un vecteur u par un autre vecteur v est le produit scalaire usuel de ces vecteurs :

                  | u₁|

^tv.u = |v₁ ... v_n|*|...|

                  | u_n|

À noter qu'un scalaire est une matrice à une ligne et une colonne. En fait, chaque coefficient est le produit scalaire d'une ligne par une colonne.

Le déterminant d'une matrice est un scalaire. Il ne peut être calculé que si la matrice est carrée (autant de ligne que de colonnes). L'expression générale étant plutôt compliquée (elle met en jeu la permutation des coefficients), je me contenterai ici d'exprimer le déterminant d'une matrice 2,2 qui nous est seul utile ici.

si M = |a b|

       |c d|

alors det M = a.d - b.c Pour information, le déterminant de M.^tM est : det (M.^tM) = 10*23*15 + 4*(-4)*(-10) + 4*(-4)*(-10) - 10*(-10)² - 4²*23 - 15*(-4)² = 2162

Une matrice carrée M possède un inverse si son déterminant est non nul. Elle est notée M^-1. Son calcul est quelque peu compliqué, il fait intervenir entre autre le déterminant, et n'a pas d'intérêt ici, aussi je ne l'explique pas. Sachez simplement que les produits à droite et à gauche avec la matrice d'origine égalent la matrice unité.

M.M^-1 = M^-1.M = I

Toutes ces définitions s'agencent encore entre elles. À titre d'exercice, vous pourriez chercher comment ...

2-Expression générale de la rotation

La propriété essentielle d'une rotation est de conserver la distance par changement de repère. Si u est le vecteur reliant les points A et B, la distance de A à B est la racine du produit scalaire usuel de u : d² = ^tu.u

Mais un produit scalaire s'écrit plus généralement,

^tu.M.v

Dans le cas où M est I, on retrouve le produit scalaire usuel.

Un changement de repère s'écrit

u' = P.u où P est une matrice carrée de déterminant non nul.

Combinons tout cela. La propriété d'invariance s'écrit alors,

d² =^tu.M.u = ^tu'.M.u'

En exprimant u' en fonction de u on obtient,

d² = ^tu.^tP.M.P.u

Cela doit être vrai quelque soit u, donc,

M = ^tP.M.P

Ceci est l'expression générale qui remplace

L.I.^tL = ^tL.I.L = I

La seconde condition, det P = 1, est implicite. Une propriété du déterminant est l'associativité,

det (A.B) = det A * det B de plus, det(^tP) = det P

on en déduit facilement des relations précédentes que

(det P)² = 1

Cette relation est encore plus générale. Elle comporte les rotations, mais aussi les symétries (point, droite, plan, ...). On se restreint à l'ensemble des matrices de déterminant positif qui regroupe toutes les rotations.

Dans le cadre de la relativité, M est la matrice h. Il est alors facile de constater que g vérifie la condition sur les rotations

h = g.h.g

Ici, il n'a été tenu compte que de deux dimensions. En réalité, il y en a quatre. La matrice h s'écrit alors

    |1  0  0  0|

h = |0  1  0  0|

    |0  0  1  0|

    |0  0  0 -1|

et gère à la fois les rotations de l'espace qui nous sont familières, et les rotations relativistes. À noter qu'il existe une autre convention où les signes sont inversés. Mais cela ne change rien au principe.

12 Octobre 2002